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摘 要 : 由 于 目前 通过 蜂窝 基站 定位 的 精度 不 够 高 和 信 令 数据 产生 的 不 确定 性 ， 所 以 通过 手机 信 令 数据 估计 交通 信息 
参数 的 精确 度 仍 然 是 一 个 巨大 的 挑战 。 高 速 路 车 辆 速度 参数 是 评估 道路 服务 质量 的 最 常 研究 的 参数 之 一 ， 目 前 基于 手 
机 信 令 数据 的 交通 参数 估计 基本 步骤 为 数据 收集 及 预 处 理 、 地 图 匹配 、 用 户 路 线 匹配 确定 和 交通 信息 参数 估计 。 在 此 
基础 上 ， 根 据 物 理 运动 学 知识 ， 针 对 手机 信 令 数据 产生 的 不 确定 性 和 容易 参 杂 平行 公路 噪声 用 户 数 据 的 影响 ， 提 出 一 
种 融合 距离 加 权 的 改进 车 辆 速度 计算 方法 ， 并 在 此 方法 之 上 进一步 提出 一 种 消除 平行 公路 干扰 数据 的 车 辆 速度 计算 
法 ， 提 高 计算 准确 度 。 利 用 某 移动 公司 提供 的 平台 进行 实例 验证 ， 并 采用 平均 绝对 误差 MAE、 均 方 根 误 差 RMSE、 平 
均 绝 对 百分比 误差 MAPE 作为 性 能 指标 ， 该 方法 模型 性 能 均 优 于 传统 方法 模型 ， 并 且 平 均 绝 对 百分比 误差 比 传统 方法 
降低 10% 左 右 ， 具 有 重要 的 应 用 价值 。 
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Abstract: Due to the current high accuracy of positioning via cellular base stations and the uncertainty of signaling data, 
estimating the accuracy of traffic information parameters using cell phone signaling data remains a significant challenge. 
Highway speed parameters are one of the most commonly studied parameters for evaluating road service quality. At present, the 
basic steps of traffic parameter estimation based on cell phone signaling data are as follows: Data collection and preprocessing, 
map matching, user route matching determination and traffic information parameter estimation. On this basis, according to the 
knowledge of physical kinematics, aiming at the uncertainty of handset signaling data and the influence of parallel highway 
noise on user data, an improved vehicle speed calculation method based on weighted distance fusion is proposed and further 
proposed on this method A Method of Vehicle Speed Calculation to Eliminate Parallel Highway Interference Data and Improve 
Calculation Precision. Using a platform provided by a mobile company for instance verification, and using the average absolute 
error MAE, root mean Square error RMSE, average absolute percentage error MAPE as a performance indicator in this paper, 
the performance of the method model is better than the traditional method model, and the average absolute percentage error is 
about 10% lower than the traditional method, which has important application value. 
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0 引言 


通信 息 系统 越 来 越 重 要 。 目 前 高 速 路 的 交通 流 数据 主要 通过 感 


应 线圈 、 地 磁 、 视 频 、 雷 达 探 测 器 以 及 红外 等 检测 器 ， 这 些 方 


近年 来 , 经 济 的 增长 和 技术 进步 的 崛起 导致 了 智能 交通 系 式 需要 在 道路 上 安装 检测 器 设备 ， 需 要 耗费 大 量 的 人 力 物 力 。 


统 (ITS) 对 交通 服务 的 需求 越 来 越 高 ， 如 何 构建 ITS 的 实时 交 或 者 通过 GPS 进行 车 辆 信息 采集 , 但 这 种 方式 需要 在 运行 车 辆 
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上 装载 GPS 相关 设备 , 初期 投资 成 本 高 , 并 且 收 集 数 据 不 完整 ， 
具有 一 定 的 局 限 性 。 随 着 蜂窝 网 络 的 全 面 密集 履 盖 和 手机 的 普 
及 ， 使 用 手机 信 令 数据 来 获取 交通 信息 参数 在 目前 已 经 成 为 一 


高 。 本 文 针对 信 


彭 大 芹 ， 


种 有 效 可 行 的 方式 ， 由 于 其 不 仅 成 本 底 和 全 面 履 盖 ， 还 可 以 准 
确实 时 全 天 候 获取 交通 参数 信息 ， 所 以 基于 蜂窝 手机 信 令 数据 
估计 交通 参数 和 状况 已 经 成 为 了 一 种 蔡 代 传统 方式 的 热门 的 技 
术 方 案 。 
近年 来 , 有 很 多 关于 通过 移动 手机 信 令 数据 来 获取 高 速 公 
路 交通 流 参 数 和 路 况 信 息 方 面 的 国内 外 的 研究 ， 主 要 的 交通 流 
参数 包括 车 辆 速度 、 车 辆 密度 、 行 程 时 间 和 车 流量 等 于 
,其 中 车 辆 速度 参数 是 高 速 公路 交通 信息 中 最 重要 参数 之 一 ， 
也 是 在 评估 道路 服务 质量 的 最 常 研究 的 参数 之 前 基于 移 
动手 机 信 令 数据 的 高 速 公 路 车 辆 速度 计算 方法 主要 分 为 两 种 : 
第 一 种 是 通过 两 点 的 行程 距离 差 与 行程 时 间 差 的 比值 VW = 


守 池 玉 计算 速度 ; 第 二 种 是 通过 路 段 的 交通 流量 (veh/h) 与 交 


全 


通 密度 (veh/km) 的 比值 Vi = 中 来 计算 速度 。 文 献 错误 ! 未 找到 


引用 源 。 中 基于 对 手机 信 令 数据 的 分 析 验 证 了 信 令 数据 在 交通 
拥堵 识别 方面 的 重要 价值 ， 并 通过 手机 用 户 在 行驶 过 程 中 在 基 
站 间 切 换 产 生 的 信 令 数据 来 计算 行程 距离 差 和 行程 时 间 来 计算 
车 辆 速度 ， 进 而 进行 拥堵 状态 识别 ， 证 明了 这 种 方法 的 可 行 性 
性 。 当 手机 用 户 执行 呼叫 并 从 小 区 1 移动 到 小 区 2 时 ， 产 
生 并 记录 越 区 切换 信和 号。 此外, 手机 用 户 保持 从 小 区 2 移动 到 小 
区 3, 还 生成 并 记录 另 一 越 区 切换 信和 号。 可 以 分 析 这 两 个 越 区 切 
换 信号 以 获得 小 区 2 的 小 区 驻 留 时 间 和 车 辆 行程 距离 .然后 可 以 
古 计 高 速 公路 路 段 的 车 辆 速度 9。 文献 错误 ! 未 找到 引 
用 源 。 提 出 基于 位 置 切换 的 交通 速度 估算 方法 ， 根 据 用 户 轨迹 
与 目标 路 段 切换 序列 使 用 求 最 长 公共 子 序 列 的 方法 进行 地 图 匹 
配 ， 利 用 切换 点 距离 与 行程 时 间 的 比值 来 估算 交通 流速 度 ， 
取得 了 不 错 的 效果 ， 但 速度 波动 较 大 ， 存 在 干扰 数据 ， 致 使 计 
算 精 度 不 够 高 。 文献 错误 ! 未 找到 引用 源 。 通 过 手机 用 户 位 置 切 
换 和 正常 位 置 更 新 的 数量 估计 交通 密度 ， 并 根据 用 户 呼 叫 到 达 
和 周期 性 更 新 的 数量 估计 交通 流量 ， 进 而 估算 车 辆 速度 ， 证 明 
了 方法 可 行 ， 但 是 由 于 利用 手机 信 令 数据 估计 交通 密度 和 交通 
流量 的 准确 度 不 够 高 和 计算 复杂 ， 故 存在 较 大 误差 。 后 来 研究 
者 发 现 利 用 手机 信 令 数据 估计 交通 速度 会 存在 大 量 噪声 数据 的 
影响 ， 如 高 速 路 周边 的 行人 、 周 边 公 路 的 车 辆 用 户 等 ， 并 有 研 


名 


数据 ， 


算 车 辆 速度 的 计算 方法 。 
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车 般 这 度 许 站 方法 模型 研究 


参 杂 噪声 数据 的 缺点 ， 致 使 高 速 公 路 车 辆 速度 计算 
令 数 据 的 产生 的 不 确定 性 
成 的 距离 长 度 不 一 的 路 程 差 的 特点 ， 
差 与 行程 时 间 差 的 比 人 


进 


准确 度 不 够 
而 在 一 个 高 速 路 段 生 
是 出 利用 两 点 的 行程 距离 


WT 


中 引入 与 距离 相关 的 加 权 因 子 函 数 来 计 
还 特别 针对 高 速 路 周边 平行 公路 


步 提 出 一 种 基于 移动 手机 信 令 数据 的 平行 公路 


扰 


消除 的 车 辆 速度 计算 方法 ， 很 大 程度 提高 了 高 速 路 车 辆 速度 计 


算 的 准确 度 ， 对 于 基于 手机 信 令 手机 获取 交通 信息 的 方法 可 以 


很 好 应 用 在 现代 智能 交通 系统 (ITS)， 进 一 步 提高 服务 质量 
有 重要 的 意义 。 
1 ”基本 概念 
1.1 产生 手机 信 令 数据 的 通信 事件 

当 车 载 手机 用 户 在 高 速 公路 上 行驶 的 过 程 中 会 不 确定 性 的 
在 周边 基站 产生 手机 信 令 数据 ， 手 机 信 令 数据 的 产生 是 由 一 些 
通信 事件 所 驱动 生成 的 ， 以 下 是 产生 手机 信 令 数据 的 通信 事件 
的 一 个 简单 的 概括 介绍 ， 如 图 1 (b) 所 示 。 


的 手机 


图 1 (a) 车 载 


周期 性 位 置 
位 置 更 新 更 新 
as 正常 位 置 更 新 


事件 


呼叫 连接 


Don 
或 分 离 


图 1 


户 在 高 速 路 上 行驶 过 程 


MSI 附 着 是 手 
机 开机 或 SIM 卡 
插入 


IMSI 分 离 是 手机 


关机 


原始 信 令 


以 上 5 类 通信 
数据 采集 系统 平 


等 预 处 理 后 ， 再 通 
接收 G85 高 速 公路 


过 数据 传输 管道 
监测 区 域 的 


(pb) 通 信和 寻 
事件 产生 的 手机 信 令 数 
台 并 经 过 对 数据 进行 过 滤 去 噪 


基站 的 手机 信 


EF 件 简介 图 


居 经 过 移动 运营 商 


首 分 发 到 各 个 处 理 模块 。 


令 数 据 用 于 本 文 的 


ee a 实验 研究 ， 手 机 信 令 数据 包含 的 主要 字段 与 说 明 如 表 1 所 示 。 
体 ， 同 时 滤 除 噪声 数据 的 方法 ， 通 过 此 方法 计算 的 车 辆 速度 ;# 本 文 主要 用 到 1, 2, 3, 4, 5 的 字段 , 其 中 通过 LAC 和 CELLID 
确 度 得 到 了 提高 ss 。 文 献 错误 ! 未 找到 引用 源 。 提 出 了 ”可 以 匹配 到 基站 的 经 度 〈Lng) 和 纬度 (Lat)。 

种 基于 手机 信 令 数据 的 高 速 路 车 速 估 计算 法 ， 引 入 了 信和 令 间 表 1 移动 用 户 信 令 数据 部 分 字段 说 明 

隔 区 间 闪 值 和 时 间 间 隔 闪 值 ， 通 过 该 闪 值 的 限制 ， 能 够 滤 除 一 序号 字段 名 称 字段 说 明 

部 分 误差 数据 ， 能 很 大 程度 降低 定位 不 准确 导致 的 速度 计算 误 1 IMSI 司 际 移动 用 户 识别 码 ， 唯 一 的 手机 识别 


于 手机 信 令 数据 产生 的 不 确定 性 和 容易 


2 TimeStamp 


信 令 数据 发 生 的 时 间 戳 ，YYYYMMD 
DHHMMSS， 精 确 到 秒 
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3 LAC 位 置 区 编号 人 开始 ) 
4 CELLID 小 区 位 置 区 编号 


通信 事件 类 型 ; (1 周期 性 更 新 ，2 正常 位 置 更 
5 EventID 新 ，3 收发 短信 ，4 呼叫 切换 ，5 切换 ，6 开关 


移动 信 令 数据 
基站 数据 


高 速 路 GTS 数 据 


) 

和 数据 预 处 理 / 数 据 维护 

6 Flag 进出 小 区 标识 l 

7 Cause 切换 原因 路 网 匹配 ， 构 建 地 理 栅 格 系统 ， 根 据 最 短 欧式 距 
< 离 ， 进 行 基站 与 高 速 公路 的 路 段 匹 本 

8 ”Result 事件 结果 


1.2 手机 信 令 数据 的 噪声 数据 

高 速 公路 路 网 复杂 ， 临 近 周 边 存在 平行 公路 、 乡 村 道路 和 
省 道路 等 ， 并 且 由 于 基站 的 定位 精度 不 够 高 ， 所 以 原始 手机 信 
令 数据 中 会 引入 大 量 的 噪声 用 户 数据 ， 例 如 高 速 路 周边 道路 的 
行人 、 周 边 的 居民 、 高 速 路 临近 平行 公路 和 乡村 道路 的 用 户 等 
噪声 用 户 数据 。 这 些 干扰 噪声 数据 会 在 车 辆 速度 计算 时 造成 严 -YY 
重 的 影响 ， 导 致 车 辆 速度 计算 的 不 准确 。 目 前 针对 高 速 路 周边 有 
居民 和 行人 的 干扰 数据 已 经 存在 解决 的 方法 ， 但 是 没有 特别 针 
对 高 速 公路 临近 平行 公路 和 乡村 道路 等 的 车 辆 用 户 干扰 数据 的 
解决 方法 。 因 此 本 文 提出 一 种 平行 公路 干扰 消除 的 方法 ， 并 在 
此 基础 上 进行 车 辆 速度 计算 。 高 速 路 周边 的 平行 道路 图 如 图 2 
所 吉 。 


户 路 径 匹 配 ， 识 别 出 高 速 公路 用 户 


是 否 为 高 速 公 路 


到 


计算 道路 栅 格 得 车 辆 平均 速度 


结束 


图 3 传统 高 速 路 车 辆 速度 计算 方法 流程 图 


提取 所 需 你 字 
字段 缺失 数 提 


按时 间 顺 
序 生成 轨 
迹 序列 


图 4 数据 预 处 理 


图 2 平行 道路 图 2.2 路 网 匹配 

后 路 网 匹配 也 就 是 高 速 公 路 路 段 与 移动 基站 覆盖 的 匹配 , 根 
人 据 高 速 公 路 路 段 序列 建立 与 基站 的 映射 关系 表 是 进行 高 速 公路 
目前 ， 对 于 利用 手机 信 令 数据 获取 高 速 公路 交通 流 参数 信 “用户 路 径 匹 配 和 车 辆 速度 计算 的 基础 前 提 ， 本 文 考虑 到 道路 段 
息 已 经 存在 了 一 定 深入 的 研究 ， 特 别 的 ， 研 究 者 对 于 基于 手机 ”与 基站 的 距离 和 基站 的 扇 区 覆盖 方向 等 影响 因素 进行 高 速 路 路 
说 令 数据 的 高 速 公路 车 辆 速度 计算 方法 的 研究 也 做 出 了 巨大 的 。” 段 与 基站 的 最 大 可 能 匹配 ， 其 主要 的 步 又 如 下 : 
贡献 "1 ， 为 了 从 获取 的 手机 信 令 数据 中 获取 到 高 速 路 的 车 辆 有 ) 根 据 高 速 公 路 道路 的 路 线 ， 建 立 一 个 矩形 监测 区 域 ， 使 
速度 参数 ， 可 以 包括 以 下 基本 步骤 信 令 数据 预 处 理 ， 路 网 匹 。 ”得 矩形 区 域 完全 包括 高 速 公 路 ， 以 矩形 区 域 的 左下 角 点 为 原点 
配 ， 进 行 高 速 路 和 基站 序列 的 匹配 ， 高 速 公路 用 户 路 径 匹 配 ， “建立 二 维 坐标 系 ， 并 以 长 为 工 的 正方 形 栅 格 对 矩形 区 域 进行 机 
判断 识别 高 速 公路 行驶 车 载 用 户 ， 高 速 公 路 车 辆 速度 计算 。 具 ” 格 划分 。 记 录 高 速 路 为 道路 棚 格 序列 


| 


体 的 流程 框架 图 如 图 3 所 示 。 Seg = {Sxi,y, (ng, lat), ..., Sx,y; (Ing, lat), ..., Sx,,y, (Ing, lat)} 
2.1 数据 清洗 与 预 处 理 记录 监测 区 域 的 基站 序列 为 

由 于 基站 定位 技术 的 定位 精度 不 够 高 、 高 速 路 周边 环境 的 sta = {Mx,,y, (ng, lat), …Mxiyi(lng,lat) ..., Mx,,,y,, (Ing, lat)} 
复杂 性 和 手机 信 令 数据 产生 的 不 确定 性 ， 由 移动 运营 商 的 手机 为 每 个 道路 调和 格 最 大 可 能 匹配 对 应 的 基站 。 通 过 经 纬度 
原始 信 令 数据 采集 系统 平台 收集 的 信 令 数据 会 存在 大 量 的 “ 脏 ”计算 道路 栅 格 序列 里 每 个 栅 格 与 基站 序列 的 每 个 基站 的 欧式 距 


数据 ”所 以 必须 对 收集 的 原始 手机 信 令 数据 进行 字段 提取 、 滤 ，” 离 ， 并 且 确 定 基 站 肩 区 是 否 履 盖 到 道路 栅 格 ， 选 取 距 离 最 短 并 
除 脏 数据 、 过 滤 乒 乓 效应 数据 等 数据 预 处 理 操作 ， 有 利于 下 且 基 站 扇 区 覆盖 道路 栅 格 的 基站 为 该 道路 栅 格 的 映射 基站 。 

步 的 快速 计算 ， 提 高 匹配 精度 。 其 数据 预 处 理 的 处 理 步 又 如 图 9 以 二 维 坐标 序列 号 升序 方向 {(xu ya (Xi (Xn yn)} 
4 所 示 。 为 高 速 路 的 正方 向 ， 降 序 方向 { (xn 加 ) (ci) (xy)} 为 高 
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文献 [11] 
通过 两 轨迹 


其 中 :Mxy,(ling, lat) 是 基站 位 置 点 ，dist 是 讨 


之 间 的 欧式 距 


传统 高 速 公路 道路 栅 
点 的 行程 路 程 差 和 行 


格 车 和 


dist{Mxiyi(Ing,lat),Mx, 


i 
Tj—Ti 


离 ，7 


若 计 算 
包括 道 


经 过 


1) 本 文 方 


传统 方法 单纯 考虑 了 行程 路 程 差 和 行程 时 间 差 的 比值 来 计算 车 


道路 


路 


格 KK， 则 3 
Vx 一 
法 模型 1 


辆 速度 ， 但 
含 一 个 道路 


于 手机 信 令 数据 产生 的 不 确定 


;一 是 两 点 的 行程 时 间 
格 K 的 平均 速度 ， 假 设 有 n 个 两 两 轨迹 点 
道路 栅 格 K 的 平均 车 辆 


差 。 


性 ， 


格 会 存在 行程 距离 长 度 不 一 样 的 多 个 两 两 和 


进而 


用 户 速 度 的 计算 主要 
旦 时 间 差 的 比值 来 计算 。 


yj(ing,lat)} 


(GD 


| 算 两 个 基站 位 置 点 


速度 为 Vi.。 


2) 


和 i 会 造成 包 


这 种 不 确定 性 


会 对 高 速 路 车 和 


本 在 传统 方法 


的 基础 上 ， 根 据 物理 运动 


意义 的 角度 上 
程 距 离 越 短 ， 
因此 本 文 根 据 
算 方法 ， 其 改 
知 改进 部 分 方 


可 知 包含 一 个 道路 
则 对 该 道路 栅 格 平均 速度 
此 特点 提出 


种 融合 路 程 加 


速度 计算 有 一 定 的 影 


学 的 思 


银 知 识 ， 
格 的 两 轨迹 点 计算 单元 的 路 
的 贡献 值 越 大 的 特点 ， 
权 的 改进 车 加 


向 ， 因 此 文 
统计 


速度 计 


进 方法 的 具体 流程 框图 如 


区 


5 所 示 。 


法 步骤 如 下 : 


a) 计算 包 
间 ， 用 于 计算 


含 某 道路 


流程 图 可 


格 的 两 两 轨迹 点 的 行程 距离 和 行程 时 


对 该 道路 


格 的 车 辆 平均 速度 的 速度 贡献 值 的 其 


L 迹 点 。 


平均 速度 贡献 值 


| 


对 道路 栅 格 里 的 多 个 平均 速度 贡献 值 进 
行 求 和 运算 得 到 最 终 的 车 辆 平均 速度 


V 合 ‘EE 
录用 稿 彭 大 芹 ， eg PR 信念 央 天 。 
速 路 反方 向 ， 建 立 高 速 路 段 和 基站 的 匹配 库 ， 如 表 2 所 示 。 中 之 一 。 
表 2 高速 路 与 基站 匹配 说 明 表 b) 选 择 一 个 与 行程 距离 旦 反 相关 的 加 权 因 子 函 数 glj 计 算 
序号 ”字段 名 字段 说 明 加 权 值 ， 用 于 对 速度 贡献 值 进 行 加 权 。 
1 Road ID 高 速 路 道路 栅 格 序号 (xi yi) 9 使 用 距离 权 值 函数 计算 加 权 值 然后 与 每 个 速度 贡献 值 的 
2 ”Road Lng 道路 栅 格 经 度 乘积 后 的 值 进行 求 和 运算 得 到 最 终 的 道路 栅 格 车 辆 平均 速度 值 。 
3 Road Lat 道路 栅 格 纬度 计算 公式 如 下 : 
4 Station ID 基站 栅 格 序号 (xp yi) dist{Mxiyi(Img lat) Mxjyj(Img,lat)} 
5 Station Lng 基站 经 度 W = Dp Tj-T: ” 0) 
6 Station Lat 基站 纬度 其 中 1 表示 为 第 k 个 路 段 的 第 ! 个 用 户 信 令 ，Nxe 表 示 第 K 个 路 段 
7 Flag 基站 是 否 履 盖 道 路 栅 格 ， 是 : 1， 否 : 0 的 两 两 轨迹 点 数 。 
2.3 ”高 速 公路 用 户 路 径 匹 配 CE 2 ) 
高 速 公路 用 户 路 径 匹 配 是 为 了 将 经 过 数据 预 处 理 后 的 用 户 el 
手机 信 令 数据 轨迹 序列 与 高 速 路 机 格 序列 进行 匹配 ， 初 步 识别 
出 在 高 速 路 上 行驶 的 车 载 用 户 。 其 主要 的 步骤 如 下 : | 
a) 获 取经 过 数据 预 处 理 得 到 的 监测 区 域 的 用 户 手机 信 令 数 0 
据 轨迹 序列 集 ， 提 取 每 个 用 户 的 信 令 轨迹 序列 Tracei = eT 
a lat),…, Mxiyr(Ing,1at)} 共 有 NN 个 轨迹 点 , 将 用 户 的 上 
令 轨迹 序列 与 高 速 公 路 基站 匹配 库 进 行 对 比 ， 统 计 用 户 的 信 的 
Ai Ge 
b) 计 算 用 户 信 令 轨迹 与 高 速 路 道路 栅 格 序列 的 相似 度 入 
= 电 , 当 相似 度 入 超过 一 定 阔 值 日 具 方向 性 则 判定 为 高 
速 公路 用 户 ， 用 户 的 方向 性 通过 二 维 坐标 序列 号 (xz Zi) 的 递增 计算 网 两 天 还 及 玖 行程 | 「 站 三 各 由 册 有 村 大 
和 递减 来 确定 人 | 
Se 高 速 公 公路 车 辆 速度 计算 a 


C 


ea 
结束 


2) 本 文 方法 模型 2 


图 5 本文 方法 模型 1 方法 流程 


速 公路 
狂 竺 丰 的 影响 


| 大- 


确定 | 


特别 是 高 速 路 | 


E 辆 速度 计算 准 


的 


影响 。 


确 度 除了 受 
, 还 很 大 程度 受到 了 噪声 用 
备 近 的 平行 公路 、 乡 村 道路 和 省 道路 的 行车 用 户 
于 高 速 路 的 平行 道路 一 般 存 在 于 高 速 路 的 路 段 周 边 ， 


因此 可 以 根据 其 前 面 不 存在 平行 道 


路 的 路 段 的 


2 


机 信 令 数据 产生 不 
户 数据 的 干扰 ， 


历史 用 


户 数据 进 


行 剔 除 干 


扰 用 户 。 


因此 针对 


改进 的 车 
肖 除 ， 然 后 重新 计算 含 
是 存在 平行 公路 路 
和 高 速 路 与 平行 公 
具体 的 流程 框图 


£ 


F 行 道路 干扰 用 户 ， 在 本 文 方法 模 


速度 计算 方法 的 


基础 上 进一步 对 平行 公路 干扰 


平行 道路 的 高 速 路 车 辆 速度 。 
段 的 高 速 路 与 之 前 高 速 路 段 的 用 


路 之 


如 图 


d) 获 取 当 前 


间 的 速度 差别 的 思 


\ 想 进 


6 所 示 。 其 方法 主要 的 原 到 
时 刻 的 存在 平行 公路 的 高 速 路 道路 


数 和 Ni 个 | 了 户 
高 速 路 


道路 栅 格 的 用 


同 


时 获取 其 历史 时 去 


= 


户 数 NN 个 用 


户 数 Nj 


元 也 


用 


| 的 后 方 不 存在 平行 公 


与 用 


主要 依据 
户 数 量 差别 


扰 剔 除 ， 其 
如 下 : 


户 


格 的 用 
路 的 
户 数 Nt 求 交 
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集运 算 Ni = NenN， 那 么 M = Nx 一 NL， 则 NE 部 分 用 户 是 确 
定 为 高 速 公 路 上 的 用 户 ，NE 部 分 用 户 是 不 确定 的 用 户 ; 

e) 根 据 确定 为 高 速 公路 上 的 部 分 用 户 Ni 来 计算 存在 平行 公 
路 的 道路 栅 格 的 平均 速度 值 V2, 平均 速度 值 VL 运 用 本 文 方法 模 
型 一 的 车 辆 平均 速度 计算 方法 来 计算 。 然 后 根据 平均 速度 值 融 
来 确定 该 道路 栅 格 属于 那 种 交通 状态 ， 交 通 状态 分 为 畅通 状态 
(了 二 80km/h) ， 轻 度 拥堵 状态 (40 km/h < WV < 80kmy/ 
h)， 拥 堵 状 态 (Vi < 40 km/h)。 

根据 行程 路 程 差 和 行程 时 间 差 的 比值 的 速度 计算 公式 计 
算 ME 中 每 个 用 户 的 速度 值 呢 ， 然后 与 速度 值 吕 进行 对 比 ,， 如 果 
某 用 户 的 速度 值 呢 属 于 由 由 确定 的 道路 状态 的 速度 范围 , 则 判 
定 为 高 速 公路 上 的 用 户 ， 否 则 判定 为 平行 公路 干扰 用 户 ， 并 进 
行 剔 除 处 理 。 并且 得 到 从 不 确定 为 高 速 公路 用 户 的 部 分 用 户 N& 
中 进一步 确定 为 高 速 路 上 的 用 户 N&。 

胃 对 NM 部 分 用 户 再 利用 本 文 方法 模型 1 的 车 辆 速度 计算 方 
法 计算 平均 速度 值 驼 。 

h) 根 据 经 过 平行 公路 噪声 数据 用 户 消除 后 的 用 户 数 据 重新 
进行 道路 栅 格 的 车 辆 平均 速度 的 计算 。 计 算 公 式 如 下 : 


NE 


权 一 
NE+NE 


jE X VE 人 


移动 信 令 可 锯 
基站 数据 


高 速 路 GIS 数 据 


一 一 + 数据 预 处 理 / 数 据 维护 


了 
路 网 匹配 ， 构 建 地 理 栅 格 系统 ， 根 
据 最 短 欧 式 距 离 ， 进 行 基站 与 高 速 
公路 的 路 段 匹配 
2 


高 速 公 路 用 户 路 径 匹 配 ， 识 别 出 高 
速 公路 用 户 


计算 两 两 轨迹 点 的 行程 | | 与 行程 距离 反 相 
距离 差 和 行程 时 间 差 来 | | 关 的 加 权 权 值 函 
计算 单个 速度 值 数 


I 
i 

LE 
1 

1 
1 

1 
1 

1 
| = | 
i 加 权 值 与 单个 速度 值 进行 乘积 运算 1 
1 

1 
1 
1 

1 
1 
1 

1 


得 到 平均 速度 贡献 什 


了 
对 道路 栅 格 里 的 多 个 平均 速度 贡献 


值 进 行 求 和 运算 得 到 路 段 栅 格 最 终 
的 车 辆 平均 速度 


当前 平行 公路 的 高 速 路 道路 栅 格 用 1 

户 与 历史 时 刻 的 前 面 不 存在 平行 公 

路 高 速 路 道路 栅 格 用 户 进行 交集 运 

算 

了 

确定 高 速 公 不 确定 部 
路 部 分 用 户 分 用 户 


将 确定 部 分 用 户 ， 按 照 本 文 方法 模 
型 一 计算 速度 VY， 确 定 交通 状态 


对 不 确定 部 分 用 户 ， 计 算 每 个 用 户 
的 速度 值 Vi 


1 是 否 属于 由 V 确 定 的 交通 状 
态 的 速度 范围 


按照 用 户 数 加 权 的 速度 计算 方法 重 
新 计算 平行 路 段 的 高 速 路 道路 机 格 
车 辆 平均 速度 


图 6 本 文 方法 模型 2 方法 流程 


彭 大 芹 ， 


3 ”实验 


ChinaX 


等 : 基于 知识 与 数据 驱动 的 高 速 路 车 辆 


3.1 实验 条 件 介 绍 


本 文选 择 重庆 市 G85 成 渝 高 速 


西 环 辽 交 纪 


iv 合 作 期 十 
人 


永川 收费 站 路 段 


作为 模型 的 实验 试点 路 段 ,路段 全 长 56 公里 , 使 用 矩形 框 区 域 


对 路 段 进 行 对 路 段 的 框 定 ， 如 图 6 所 示 。 


pA ER 
图 6 G85 高 速 路 测试 路 段 


手机 信 令 数据 采集 系统 实时 全 天 候 采 集 试点 高 速 路 段 周边 


的 基站 的 移动 信 令 数据 并 通过 ActiveMQ 消息 机 # 
模型 进行 计算 处 理 。 其 采集 的 原始 移动 信 令 数据 和 


所 示 : 


症 实 时 分 发 到 


图 7 移动 信 令 数据 原始 数据 示例 图 


基站 位 置 、 


表示 手机 用 


覆盖 区 ，move 表示 在 小 区 才 盖 区 中 移动 


其 中 :N 为 样本 量 数 ;xi 为 检测 器 的 结果 ;xi 为 模型 计算 的 结果 。 


以 移动 信 令 数据 为 数据 输入 源 ， 模 型 


在 高 速 路 旁 的 固定 检测 器 数据 进行 与 模型 
比 对 ， 为 了 验证 消除 平行 公路 噪声 数据 方 
择 了 具有 平行 公路 的 高 速 路 路 段 的 两 个 固定 
器 可 检测 每 5 分 钟 内 的 瞬时 3 
均 绝 对 误差 MAE， 均 方 根 误差 RMSE, 
MAPE， 计 算 公 式 如 下 : 


1 
MAE = i 


图 7 可 知 ， 原 始 数据 中 主要 包括 了 用 


o 


的 输 


的 示例 如 图 7 


户 ID、 产 生 时 间 、 
进去 小 区 标准 和 切换 原因 等 字段 ， 特 别 的 ，jumpin 


户 进入 小 区 覆盖 区 ，jumpout 则 表示 用 户 


离开 小 区 


4 结果 的 验证 采用 安装 


E 检 测 器 ， 


F 均 速度 。 模 型 的 性 能 指标 采用 平 


Xi Xi | 


NXi—x, )? 
RMSE = ee > 


于 
MAPE = ~ Pi 


3.2 ”结果 验证 分 析 


测试 路 段 监 测 区 域 的 移动 信 令 数 拉 
数据 流 经 过 ActiveMQ 消息 机 制 进行 实时 分 发 ， 每 接收 五 分 钟 
的 信 令 数据 后 分 发 给 数据 处 理 模型 经 过 2.1、2.2、2.3 节 的 步 又 
处 理 后 的 数据 再 分 别 经 过 如 下 三 种 高 速 路 车 辆 平均 速 


Xi 


Xi 一 Xi 


虽 流 由 某 移动 运营 商 提供 


型 进行 处 理 


得 到 路 段 的 平均 车 辆 速度 : a) 文 献 [11] 模 型 : 传统 车 


结果 数据 验证 
法 模型 的 有 效 性 ， 选 


固定 检测 


F 均 绝对 百分比 误差 


(5) 


(6) 


(7) 


度 计算 模 
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录用 稿 


辆 平均 速度 计算 模型 ; b) 本 文 方法 模型 1: 融合 路 程 加 权 车 辆 3 
均 速 度 计 算 模 型 ，c) 本 文 方法 模型 2: 融合 距离 加 权 + 
干扰 数据 消除 车 辆 平均 速度 计算 模型 。 
在 2.4 节 的 本 文 方法 模型 1 中 ,为 了 取得 最 好 的 计算 结果 ， 


[3 


F 行 公路 


需要 选择 一 个 最 合适 的 路 程 反 相关 的 加 权 函 数 ， 常 用 的 力 


e- CS) ,其 中 S 


00 至 22: 00 的 数据 分 别 输入 到 使 | 
辆 平均 速度 计算 方法 模型 和 传统 的 车 辆 平均 速度 计算 模型 
处 理 ， 取 两 个 固定 速度 检测 器 所 在 的 路 段 模型 的 计 


S2 


是 指 车 辆 行程 距离 .将 2017 年 5 月 17 


0 权 也 


数 有 路 程 倒数 函数 >、 路 程 平方 倒数 函数 三 、 高 斯 加 权 函 数 


日 6: 


< 一 


j 以 上 的 三 种 加 权 函 数 的 车 


| 算 结 果 与 固 


进行 


定 速 度 检测 器 数据 进行 对 比分 析 ， 得 到 误差 性 能 对 比 表 如 表 3 
所 示 。 
表 3 本 文 方法 模型 1 性 能 误差 对 比 表 
模型 名 称 速度 检测 器 MAE RMSE MAPE 
1 16.312 19.247 0.187 
文献 [11] 方 法 模型 
2 17.584 20.329 0.193 
- 了 1 8.945 11.643 0.122 
本 文 方法 模型 1 (加权) 
9.912 13.642 0.135 
1 8.547 11.476 0.113 
本 文 方法 模型 1 ( 喜 加 权 ) 
2 8.957 12.243 0.121 
| 7.983 10.671 0.105 
本 文 方法 模型 1 Ce- (S$/s) 加 权 ) 
8.256 10.968 0.110 


从 表 3 可 以 看 出 ， 本 文 方法 模型 1 的 计算 结果 都 优 于 文献 


[11] 方 法 模型 结果 


， 验 证 了 本 文 方法 模型 1 提出 的 融合 路 程 加 


权 的 改进 车 辆 速度 计算 方法 的 有 效 性 ， 
加 权 模 型 的 计算 结果 最 优 ， 因 此 选择 。- (%s) “作为 加 权 函 数 。 
进一步 考虑 平行 公路 干扰 数据 的 影响 ， 在 融合 路 程 加 权 的 


法 模型 得 到 融合 路 程 加 权 + 
计算 模型 ， 本 文 命名 为 方法 模型 2， 
模型 1 的 结果 与 两 个 


性 能 对 比如 表 4 所 示 。 


并 且 使 用 e- (CS 


表 4 ”本文 方法 模型 二 性 能 误差 对 比 表 


s) 的 


车 辆 平均 速度 计算 模型 的 基础 上 加 入 平行 公路 干扰 数据 消除 方 
F 行 公路 干扰 消除 的 车 辆 平均 速度 
将 该 模型 结果 和 本 文 方法 
固定 测速 仪 数 据 进 行 对 比分 析 ， 得 到 误差 


模型 名 称 


本 文 方法 模型 1 


本 文 方法 模型 2 


1 
2 
1 
2 


MAE RMSE MAPE 


7.983 10.671 0.105 


8.256 10.968 0.110 


6.838 8.404 0.086 


7.015 8.517 0.091 


从 表 4 可 知 ， 在 加 入 了 平行 公路 干扰 消除 后 ， 模 型 的 车 辆 
速度 计算 结果 的 MAE、RMES 和 MAPE 都 得 到 了 进 
升 ， 该 方法 能 有 效 的 消除 
速 路 临近 的 平行 道路 的 噪声 用 户 对 高 速 路 车 有 


在 选 定 了 加 权 因 子 函 数 为 高 


步 的 提 
F 行 公路 的 噪声 用 户 数 据 ， 避 免 了 高 
速度 计算 的 影响 。 
加 权 函 数 后 , 给 出 2017 年 5 


月 17 日 6: 00 至 22: 00 的 本 文 方法 模型 1、 本 文 方法 模型 2 


与 测速 仪 1 的 车 加 


平均 速度 结果 对 比 图 


和 误差 分 布 图 ， 分 别 如 


下 图 8、9 所 示 ， 本 文 方法 模型 1、 本 文 方法 模型 2 与 测速 仪 2 
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的 车 辆 平均 速度 结果 对 比 图 和 误差 分 布 图 ， 分别 如 下 图 10、11 
所 示 ， 从 图 8、10 中 可 以 看 出 经 过 平行 道路 噪声 数据 消除 的 本 
文 模型 2 的 结果 跳动 幅度 变 小 ， 更 加 接近 测速 仪 的 结果 。 从 误 
差分 布 图 9 可 以 看 出 本 文 方法 模型 1 相对 误差 10% 以 内 的 占 比 
为 74%， 相 对 误差 10%~20% 以 内 占 比 为 23%; 本 文 方法 模型 2 
相对 误差 10% 以 内 占 比 为 84%， 相 对 误差 10%~15% 以 内 占 比 
为 16%; 从 误差 分 布 图 11 可 以 看 出 本 文 方法 模型 1 相对 误差 
10% 以 内 的 占 比 为 68%， 相 对 误差 10%~20% 以 内 占 比 为 26%; 
本 文 方法 模型 2 相对 误差 10% 以 内 占 比 为 75%， 相 对 误差 
10%~15% 以 内 占 比 为 25%,， 可 以 明显 看 出 ， 本 文 方法 模型 2 相 
对 本 文 方法 模型 1 消除 了 部 分 20% 以 上 的 误差 占 比 ， 结 果 更 为 
准确 ， 进 一 步 证 明了 本 文 方法 模型 2 对 于 平行 公路 噪声 数据 消 
除 的 有 效 性 。 综 合 来 说 ， 本 文 方法 模型 2 的 计算 结果 平均 绝对 
误差 为 9% 左 右 ， 比 本 文 方法 模型 1 的 平均 绝对 误差 降低 了 2% 
左右 ， 比 文献 [11] 方 法 模型 的 平均 绝对 误差 降低 了 10% 左 右 。 


对 


图 8 模型 计算 结果 与 测速 仪 1 结果 对 比 


本 文 模型 一 误差 比率 分 布 图 


3% 
=20% 以 上 
"10%-15% 
= 10-15% 


= 5-10% 


= 0-5% 


(a) 本 文 方法 模型 1 


本 文 模型 二 误差 比率 分 布 图 


2% 


| = 10%-15% 
w 10-15% 


= 5-10% 


m0-5% 


(b) 本 文 方法 模型 2 
图 9 模型 误差 分 布 图 
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